Une étude critique du respect du cadre juridique d’accessibilité aux handicapés
Scorer et classifier les établissements pouvant accueillir les personnes en situations de handicap
2021-06-11
Une étude critique du respect du cadre juridique d’accessibilité aux handicapés
Scorer et classifier les établissements pouvant accueillir les personnes en situations de handicap
“Les ERP doivent être […] accessibles à tous, quel que soit le type de handicap notamment physique, sensoriel, cognitif, mental ou psychique.”
Un seul document sur 81 qui mentionne “handicap” dans le titre
Tout projet de data-science devrait commencer par une analyse de la qualité des données.
On s’intéresse en priorité aux critères bien renseignés (taux de valeurs manquantes faible).
On peut distinguer le sport comme pratique ou comme spectacle.
En matière de santé publique, l’accès à la pratique prévaut.
Par ailleurs la proportion des établissements “accessibles” dans l’ensemble est un élément important.
On distingue un écart colossal d’accessibilité aux handicapés moteurs (55%) vs sensoriels (3%)
On retrouve cette séparation des handicaps sensoriels vs moteurs dans la CAH des corrélations.
Les écarts d’accessibilité à la pratique sportive aux handicapés moteurs vs sensoriels
Des taux d’accessibilités très variables d’une famille d’équipement à l’autre.
Des taux d’accessibilités très variables d’un type d’équipement à l’autre.
Athlétisme, ski, natation, activités aquatiques & aériennes.
Mesuré avec un modèle logistique sur 9530 équipements d’athlétisme.
Pour continuer d’appréhender les données, on entraîne des modèles généralistes sur les variables communes aux différents types d’équipements.
Faute de temps pour tout explorer, on se concentre sur l’accessibilité aux aires de jeu pour les handicapés moteurs.
Pour tenir compte de toute la diversité des ES on construit le jeu d’entraînement de 100,000 observations par tirage stratifié par famille d’ES.
Fournir au bureau compétant un outil d’aide à la décision pour identifier les “mauvais élèves” ie non accessibles alors que les établissements similaires sont plutôt accessibles.
Fournir au site https://www.handiguide.sports.gouv.fr/ une liste des “bons élèves” ie les établissements accessibles malgré la pauvreté de l’offre dans les établissements similaires.
Pour aller plus loin, on pourrait fournir un outil de recherche d’alternative (complémentaire à https://www.handiguide.sports.gouv.fr/) qui permet de voir tous les ES par famille > type puis 1) trouver facilement les établissements accessible par handicap 2) référencer ceux qui ne le sont pas et mettre un lien direct pour leur envoyer un email demandant la mise aux normes (champ Email de la personne ressource + web-scrapping). Le lien ici
En plus de la correction des variables multi-catégorielles et numériques mal codées, on remplace également certaines variables multi-modales par la valeur moyenne de la cible calculée sur le jeu d’entraînement pour éviter le data leakage.
Le taux d’accessibilité moyen par famille d’établissement donne une AUC à 67.8% (sur les données de test).
Permet de continuer de découvrir des variables mal codées et d’identifier en priorité les variables les plus pertinentes.
Modèle de référence en termes d’interprétabilité.
Inteprétation de la contribution des variables pour les erreurs les plus extrêmes (SHAPLEY répartition des contributions)
Params :
On pourrait
Interprétation à l’aide d’un diagramme waterfall en triant les contributions en valeur absolue grâce à xgboostExplainer